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基于 STM 分 析 旅 行者 对 不 同 档次 酒店 的 


lin t 25 5r 


DER REF MEH 


(武汉 大 学 经 济 与 管理 学 院 武汉 430072) 


摘要 : [ 目的] 探测 Web2.0 时 代 下 , 不 同类 型 旅行 者 对 不 同 档次 酒店 提供 的 产品 或 服务 的 偏好 差异 。 方法 ] 将 


酒店 划分 为 豪华 型 酒店 和 经 济 型 酒店 , 将 旅行 者 划分 为 5 种 旅行 类 型 ， 分 析 不 同 旅行 者 对 豪华 型 酒店 和 经 济 型 
酒店 的 评分 模式 , 并 借助 结构 主题 模型 (Structure Topic Model, STM) 对 酒店 在 线 评论 文本 进行 细致 分 析 , 挖掘 在 


线 评论 话题 , 分析 各 个 旅行 类 型 的 旅行 者 对 不 同 档次 酒店 提供 的 服务 偏好 差异 。[ 结果 ] 实验 结果 表明 : 5 种 旅行 
类 型 下 ,旅行 者 对 豪华 型 酒店 的 平均 评分 均 高 于 对 经 济 型 酒店 的 平均 评分 ; 各 类 旅行 者 ,对 不 同 档次 酒店 所 提 
供 的 产品 或 服务 存在 偏好 差异 。[ 局 限 ] 实验 数据 不 够 充分 ; 忽略 了 诸如 性 别 、 年 龄 等 因素 对 在 线 评论 的 数值 评 
分 和 文本 内 容 的 影响 。[ 结论 】 分 析 不 同类 型 旅行 者 对 不 同 档次 酒店 的 偏好 差异 ， 有 助 于 酒店 管理 者 制定 服务 供 


应 策略 ， 有 助 于 消费 者 制定 购买 决策 。 


关键 词 在 线 评论 ”评分 模式 ”酒店 档次 ”旅行 方式 ”STM 评论 话题 

分 类 号 : F59 G350 

1 引言 行 "、“ 朋 友 旅 行 "、“ 独 自 旅 行 ”; 按照 酒店 星 级 , 将 酒 
A 


随 着 Web2.0 时 代 的 快速 发 展 ， 越 来 越 多 用 户 在 网 
络 平台 上 发 表 观 点 。 在 线 评论 网 站 是 一 种 非常 流行 的 
Web2.0 应 用 品 ， 人 允许 用 户 以 几乎 为 零 的 成 本 在 网 络 上 
发 布 他 们 对 某 个 产品 或 服务 的 购买 体验 中 ,形成 用 户 
生成 内 容 (User Generated Content，UGC)。 人 研究 表明 ， 
UGC 不 仅 能 帮助 潜在 消费 者 做 出 购买 决策 , 还 能 帮助 相 
关 管 理 者 提高 其 产品 或 服务 的 质量 , 获得 更 多 收益 1。 

相关 研究 表明 , 不 同 旅行 类 型 的 旅行 者 对 酒店 服 
务 的 偏好 不 同 同时 ,不 同 档次 酒店 的 定位 不 同 ， 
目标 市 场 不 同 , 因而 消费 者 对 其 期 望 不 同 , 产生 的 入 
住 体验 也 不 同 009。 然 而 , 以 往 学 者 对 酒店 在 线 评论 进 
行文 本 分 析 时 ,多 集中 于 话题 提取 ,人 鲜 有 学 者 考 
外 消费 者 旅行 类 型 和 酒店 档次 , 分 析 消 费 者 对 酒店 服 
务 的 偏好 差异 。 因 此 ， 本 文 按 旅行 者 的 出 行 方式 中 
将 旅行 者 划分 为 “商务 旅行 "、“ 夫 妻 旅 行 "、“ 家 庭 旅 


店 分 为 豪华 型 酒店 和 经 济 型 酒店 54， 研究 各 类 旅行 者 
对 不 同 档次 酒店 的 评分 差异 以 及 服务 偏好 的 差异 。 

本 文 对 酒店 在 线 评 论 的 数值 评分 进行 基本 描述 性 
统计 分 析 , 借助 结构 主题 模型 (Structural Topic Models, 
STM) 2 对 评论 文本 内 容 进 行 话题 提取 , 并 加 入 “ 酒 
店 档 次 ”作为 主题 强度 和 主题 内 容 的 协 变量 ， 分 别 分 
析 各 类 旅行 者 对 不 同 档次 酒店 的 服务 偏好 差异 。 


2 文献 综述 


酒店 在 线 评论 是 旅行 者 在 酒店 网 站 或 第 三 方 评论 
网 站 上 生成 的 对 入 住 酒店 的 体验 评价 上 。 在线 评论 能 
够 吸引 潜在 消费 者 访问 , 增加 访问 时 间 , 并 提升 卖家 
与 买 家 的 关系 质量 。 现 有 研究 对 在 线 评论 的 讨论 多 集 
于 在 评论 数量 、 在 线 评论 得 分 、 在 线 评论 效 价 、 在 线 
评论 极 性 以 及 在 线 评 分 差异 性 等 对 产品 销量 或 购买 意 
愿 的 影响 , 旦 这些 变 量 多 以 评分 为 背景 >", 很 少 涉 
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及 评论 的 文本 内 容 。 

旅行 者 在 TripAdvisorcom 撰写 酒店 评论 时 , 38 
常会 被 问 到 “这 次 旅行 属于 哪 种 类 型 (What sort of trip 
was this)”， 旅 行者 需要 在 5 种 旅行 类 型 (商务 、 夫 妻 、 
家 庭 、 朋 友和 独自 旅行 ) 中 , 选择 一 种 属于 他 的 旅行 类 
型 史实 。 以 往 研 究 表明 , 不 同 旅行 者 的 旅行 目的 和 期 
望 的 不 同居 2 会 导致 其 对 酒店 提供 的 设施 或 服务 的 
偏好 亦 不 同 ， 如 位 置 LLocatiom) 、 卫 生 (Cleanliness) TE 
价 比 (Value for Money) 等 。 Rivers 等 四 的 研究 结果 表明 ， 
商务 出 行 的 旅行 者 非常 关注 酒店 位 置 的 便利 性 及 网 络 
的 可 获得 性 ， 较 少 关注 酒店 的 价格 ; Lee 等 中 的 研究 结 
果 表 明 , 夫妻 出 行 的 旅行 者 对 酒店 的 满意 程度 容易 受 
到 目的 地 气候 变化 及 浪漫 程度 的 影响 ; Lai 等 由 的 研究 
结果 表明 , 与 独自 出 行 的 旅行 者 相 比 , 与 家 庭 或 者 朋 
友 一 起 出 行 的 旅行 者 更 强调 安全 。 
国内 在 游客 旅游 偏好 方面 的 研究 较 于 国外 起 步 
晚 ,1987 ^E, 保 继 刚 镶 分析 了 旅游 者 偏好 、 旅 游 动 机 、 
旅游 者 行为 与 旅游 地 空间 相互 作用 的 关系 。2006 年 ， 
杨 瑞 ” 运用 回归 分 析 方 法 , 分 析 西 安 市 大 学 生 游客 
群体 的 出 行 偏好 、 需 求 特征 和 消费 特征 ,并 比较 了 大 


学 生 和 普通 游客 的 旅游 出 行 偏好 行为 。2010 F, A 
菊 等 5 利用 调查 问卷 方法 分 析 西 安 市 国内 旅游 者 的 
旅游 偏好 行为 .2011 年 , 雷 俐 丽 中 对 大 连 市 游客 的 旅 
游 动机 、 旅 游 体 验 和 旅游 产品 进行 了 偏好 分 析 ， 并 对 
比 研究 了 不 同 出 行 类 型 的 游客 的 旅游 行为 特征 。 

然而 , 目前 缺少 酒店 档次 与 消费 者 偏好 相关 的 研 
究 成 果 , 虽然 顾 秀 玲 中 在 对 环 太湖 度假 酒店 4 类 顾客 
消费 者 行为 进行 的 实证 研究 中 , 考虑 了 游客 对 不 同 星 
级 酒店 的 评价 , 但 并 未 涉及 评论 文本 内 容 。 然 而 对 酒 
店 在 线 评论 文本 进行 话题 发 现 分 析 庆 ”， 能 有 效 发 现 
不 同类 型 旅行 者 对 酒店 偏好 的 差异 。 因 此 , 本 文 借助 
无 监督 的 主题 模型 STM 分 析 各 类 旅行 者 对 不 同 酒店 
档次 的 偏好 差异 。 

STM 作为 主题 模型 ”的 成 员 之 一 , 假定 文档 是 
若干 主题 的 混合 ,主题 为 若干 词 的 混合 。 笔 者 借助 
STM 模型 分 析 不 同 旅行 类 型 下 评论 者 对 酒店 的 文本 
评论 差异 。 此 外 , STM 允许 研究 者 加 入 其 需要 控制 的 
变量 作为 协 变 量 ,对 研究 对 象 进行 比较 分 析 。 本 文 主 
要 加 入 “酒店 档次 ”作为 协 变量 , 对 主题 强度 和 主题 内 
容 进 行 分 析 , 探测 各 个 旅行 类 型 下 的 旅行 者 对 不 同 档 
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次 酒店 提供 的 产品 或 服务 的 偏好 差异 。 


3 STM 模型 


Ej cft HRADIL, STM 是 生成 模型 。 这 
意味 着 ，STM 为 每 个 文档 都 定义 了 一 个 数据 生成 过 程 ， 
背 助 数据 找到 最 适合 该 模型 的 参数 。 在 STM 生成 模型 
中 , 文档 (D1,D;…,Dr)、 主 题 (T1,T,…,Ts)、 及 主题 - 词 
(WwW2,"…Wn) 分 布 生 成 与 元 数据 Xa(d 表 示 文 档 ) 相 联系 
的 文档 。STM 与 LDA(Latent Dirichilet Allocation) 44 
主题 模型 一 样 ， 主 题 被 定义 为 看 干 词 的 混合 ， 且 每 个 
词 都 以 一 定 的 概率 属于 某 个 主题 ; 文档 是 若干 主题 的 
混合 ， 即 一 条 评论 可 以 由 多 个 话题 组 成 ,因此 , 每 条 评 
论 的 所 有 话题 的 概率 之 和 为 1, 一 个 词 在 所 有 话题 中 
的 概率 之 和 为 1。 

在 文档 的 生成 过 程 中 ,表明 主题 强度 (Topic 
Prevalence) 和 主题 内 容 (Topic Content) 可 以 表示 为 文档 
元 数据 的 函数 。 主 题 强度 表明 一 条 评论 中 有 多 少 内 容 
与 一 个 话题 相关 , 话题 内 容 用 话题 中 的 词 表 示 。 因 此 ， 
主题 强度 协 变量 表示 主题 强度 ， 主 题 内 容 协 变量 解释 
主题 内 容 。 需 要 注意 的 是 , STM 既 可 以 只 包含 主题 强度 
协 变量 或 主题 内 容 协 变量 中 的 一 个 , 也 可 以 不 包含 任 
何 协 变量 。 

在 主题 数 为 k 的 STM 模型 中 , 每 条 评论 (文档 d) 的 
生成 过 程 可 以 被 描述 如 下 : 

(D 从 基于 文档 协 变量 Xa 的 广义 线性 模型 中 , Æ 
成 文档 -主题 6 | Xay, ~ Logistic(h = Xay, Y.) ; 

2) 用 基准 词 分 布 (m), 主题 偏差 (Ki), 协 变量 偏 
差 (Ks) 及 其 交互 向 偏差 Ki-(eq)， 生 成 能 表示 每 个 主题 (k) 
WIJI, Bar oc expm* K, + Ka + Ki(ked)); 

(3) 对 于 文档 中 的 每 个 词 , n(n e 1…, Nga): 

(DAE T x BM XAR, WS BLA i, 
Zan 6, ~ Multinomial(0) ; 

国 从 被 选 定 的 主题 中 生成 一 个 词 ， wdn |Zan， 
Buk- ~ Multinomial(D, k-z) 。 

在 本 文中 , 笔者 将 “酒店 档次 (豪华 型 酒店 和 经 济 
型 酒店 )” 作 为 协 变量 , 用 结构 主题 模型 STM 估计 酒 
店 在 线 评论 的 文档 -主题 (Document-Topic) 概 率 和 主题 - 
词 (Word-Topic) 概 率 ,， 分析 各 类 旅行 者 对 不 同 档次 酒 
店 提供 的 服务 的 偏好 差异 。 同 时 , 为 拟 合 模型 , 笔者 借 


助 半 -倒塌 变 分 EM 算法 (Semi-Collapsed Variational 
Expectation-Maximization Algorithm) ”根据 收敛 
度 (Convergence) 估计 模型 的 参数 , 进而 得 到 每 条 评 
论 的 主题 分 布 ba。 


4 实验 与 结果 分 析 


4.1 数据 来 源 
TripAdvisor.com 是 全 球 知名 的 旅游 评论 网 站 , 其 


店 评论 , 收集 评论 的 ID 、 总 体 评 分 (Overall Rating). 

评论 文本 (Review Texb 、 旅 行 类 型 (Profile) 、 住 宿 时 间 
(Trip Time)、 被 评论 的 酒店 星 级 (Star Class) 和 酒店 ID 
等 ， 其 中 旅行 类 型 包括 : 商务 (Business) 、 夫 妻 
(Couple) 、 家 庭 (Family) 、 朋 友 (Friend) 和 独自 旅行 
(Solo)。 为 分 析 评 论文 本 的 具体 内 容 , 删除 非 英 文 文本 
评论 ,最 后 得 到 101 846 条 评论 -所 采集 的 酒店 数据 中 ， 
T REA: 1.5. 2, 2.5, 3. 3.5. 4, 45, 5, EF 


每 月 独立 访问 人 数 已 经 达到 3.5. 亿 。 在 学 术 研 究 领域 
中 , 其 是 最 受 关注 的 酒店 评论 网 站 之 一 ， 近 年 来 , 许多 
研究 者 选择 其 中 的 相关 数据 作为 数据 集 进行 研究 广 ” 1。 
因而 ,本文 选取 TripAdvisorcom 的 酒店 在 线 评论 进 
行 实 验 分 析 , 具有 一 定 的 实践 意义 。 

笔者 于 2013 年 10 月 采集 2012 年 1 月 1 日 至 2013 
年 9 H 30 日 拉 斯 维 加 斯 酒店 的 相关 数据 ,对 每 一 条 酒 


按照 酒店 星 级 将 酒店 大 致 分 成 两 个 档次 : REA. 
4.5、5) 的 酒店 为 之 华 型 酒店 ; 星 级 <4(1.5、2、2.5、3、 
3.5) 的 酒店 为 经 济 型 酒店 4。 最 后 得 到 豪华 型 酒店 评 
论 68 317 条 , 经 济 型 酒店 评论 33 529 A. 
4.0. ”描述 性 统计 分 析 

分 别 对 每 类 旅行 者 对 不 同 档次 酒店 的 评分 进行 描 
述 性 统计 分 析 ， 如 表 1 所 示 : 


E1 酒店 在 线 评论 评分 的 描述 性 统计 


旅行 类 型 经 济 型 酒店 豪华 型 酒店 fut 

(Profile) N Mean SD N Mean SD N Mean SD 
商务 (Business) 4416 3.53 1.20 10 437 4.06 1.10 14 853 3.90 1.16 
夫妻 (Couple) 11 963 3.77 1.11 30 094 4.31 0.95 42 057 4.16 1.03 
AX f£ (Family) 8414 3.80 1.17 12 385 4.26 1.01 20 799 4.07 1.10 
Hi (Friends) 6 397 3.69 1.13 12 902 4.21 1.01 19 299 4.04 1.08 
独自 旅行 (Sole) 2 339 3.78 1.12 2 499 4.28 0.98 4 838 4.04 1.08 


GE: N 表示 评论 的 数量 , Mean 表示 评分 的 均值 , SD 表示 评分 的 标准 差 。) 


分 析 可 知 , 蚂 华 型 酒店 的 在 线 评论 总 数 远 高 于 经 
济 型 酒店 的 在 线 评论 总 数 ， 且 豪华 型 酒店 比 经 济 型 酒 
店 获 得 更 高 的 平均 评分 。 此 外 , 不同 旅 行 类 型 的 旅行 
者 给 出 的 酒店 评分 有 差异 : 夫妻 旅行 者 的 总 体 平均 评 
分 最 高 ; 商务 旅行 者 的 总 体 平均 评分 最 低 中 考虑 酒店 
的 星 级 ,发 现 无 论 是 豪华 型 酒店 还 是 经 济 型 酒店 ， 商 
务 旅行 者 给 出 的 平均 评分 均 最 低 ; 而 对 于 豪华 型 酒店 ， 
夫妻 旅行 者 给 出 的 平均 评分 最 高 ; 对 于 经 济 型 酒店 ， 
家 庭 旅行 者 给 出 的 平均 评分 最 高 。 

酒店 在 线 评论 的 平均 得 分 , 会 影响 潜在 消费 者 对 
酒店 购买 决策 I。 然而 , 提升 酒店 的 平均 评分 , 需要 
关注 旅行 者 选择 该 类 酒店 的 原因 及 其 所 关心 的 酒店 设施 
或 服务 ， 从 而 制定 相应 的 产品 策略 , 满足 其 实际 需求 。 
4.3 ”旅行 者 对 不 同 档 次 酒店 的 偏好 差异 分 析 

对 酒店 在 线 评论 文本 进行 分 析 , 挖 握 在 线 评论 话题 ， 
探测 各 类 旅行 者 对 不 同 档 次 酒店 的 服务 偏好 差异 。 


(1) STM 建 模 

为 分 析 同 一 类 型 旅行 者 对 不 同 档次 酒店 的 服务 偏 
好 差异 , 笔者 对 文本 分 析 数 据 进行 配对 : 对 同一 类 旅 
行者 ,随机 选择 4 000 条 酒店 的 在 线 评论 (豪华 型 和 经 
济 型 各 2 000 条 )。 借 助 R 软件 中 的 stm £1 RETE XC 
本 进行 预 处 理 ， 主 要 包括 : 将 所 有 单词 转化 为 小 写 .去 
除 停顿 词 、 移 除数 字 、 移 除 标点 符号 、 词 干 化 处 理 。 

在 构建 主题 模型 前 , 需要 确定 模型 的 主题 数 。 这 
实际 上 也 是 模型 选择 问题 ,主题 数 太 少 的 模型 会 产生 
内 容 宽 泛 的 主题 ; 主题 数 太 多 的 模型 会 产生 许多 较 小 
的 子 主题 ,难以 辨识 。Roberts 等 0 认为 主题 的 质量 和 
解释 度 主要 应 满足 两 个 准则 : 

主题 内 部 有 较 高 的 一 致 性 ， 如 讨论 “网 络 (Internet)” 的 
主题 词 中 ,高 频 词 应 包括 Internet, WiFi, Fee 等 ; 

@ 主 题 之 间 的 高 频 词 有 一 定 的 差异 性 ， 如 主题 “员工 服 
务 (Staff)” 中 的 高 频 词 Staff 不 应 是 主题 “位 置 (Location)” 中 的 
高 频 词 。 
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笔者 设 定 主题 数目 为 5-15, 通过 比较 主题 质量 ， 
发 现 主题 数目 为 10 最 符合 本 文 的 实验 模型 。 因 此 , 笔 
者 将 “酒店 档次 ”作为 STM 的 协 变量 ,分 别 分 析 各 类 
旅行 者 对 豪华 型 酒店 和 经 济 型 酒店 的 偏好 差异 。 

(2) 偏好 差异 分 析 

在 主题 模型 中 ,每 条 评论 都 可 以 表示 为 若干 话题 
的 概率 混合 。 比 如 , 依据 商务 旅行 者 对 豪华 型 酒店 的 
评论 , 可 以 计算 出 旅行 者 对 每 个 话题 的 关注 比例 0A; 
依据 商务 旅行 对 经 济 型 酒店 的 评论 , 可 以 计算 旅行 者 
对 每 个 话题 的 关注 比例 Gc。 对 于 每 一 种 旅行 类 型 , 使 
用 9s-9c, 即 可 得 到 同一 类 旅行 者 对 不 同 档 次 酒店 的 服 
务 偏好 差异 。 笔 者 定义 : 如 两 者 相 减 的 绝对 值 大 于 
0.03， 则 差异 明显 。 

人 商务 旅行 者 

依 图 1 可 知 ， 相 比 经 济 型 酒店 ,旅行 者 在 选择 豪华 型 洒 
店 时 还 关注 景观 (Topic8); 而 相 比 豪华 型 酒店 ,旅行 者 选择 
经 济 型 酒店 时 , 会 比较 关注 卫生 (Topic3) 和 交通 (Topic4)。 相 
关 研 究 表明 ， 商 务 旅行 者 选择 经 济 型 酒店 主要 有 两 种 可 能 : 
一 是 此 类 商务 旅行 者 需 自行 承担 住宿 费用 ， 经 济 能 力 有 限 ， 
其 关注 酒店 的 性 价 比 ; 二 是 此 类 商务 旅行 者 因 酒 店 位 置 的 
便利 程度 不 得 不 选择 某 个 经 济 型 酒店 B9。 


1: charg, fee, internet, H 
check, per, coffe H 
2: park, kitchen, 
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——— 


10: nice, easi, access, i 
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-010 -005 0.00 0.05 0.10 
Difference in Topic Proportions (C---A) 
图 1 商务 旅行 者 对 豪华 型 酒店 和 经 济 型 酒店 的 
偏好 差异 

Qa AE 

RE 2 可 知 ， 相 比 经 济 型 酒店 ， 夫妻 旅行 者 在 选择 豪华 
型 酒店 时 更 多 关注 酒店 的 员工 服务 (Topic6); 而 相 比 豪华 型 
酒店 ,夫妻 旅行 者 选择 经 济 型 酒店 时 , 会 比较 关注 酒店 的 卫 
生 环 境 (Topic2)。 相 关 研 究 表明 ,夫妻 出 行 注重 心情 和 浪漫 
Z, 其 满意 度 容易 受到 其 感知 的 浪漫 度 的 影响 中。 对 于 高 档 
型 酒店 ,其 提供 的 硬件 设施 服务 相对 比较 完善 ， 因 而 其 软件 
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服务 (如 员工 服务 ) 的 提升 对 夫妻 出 行 的 满意 度 至 关 重 要 ; 而 
对 于 选择 经 济 型 酒店 的 夫妻 旅行 者 ， 考虑 到 酒店 的 经 济 性 ， 
会 较 多 关注 酒店 的 卫生 环境 。 


1: arriv, check, desk, 
servic, book, airport xd 

2: new, smoke, smell, i 
york, old, carpet 


—e— 


3: locat, good, restaur, 


shop, price, walk 


4: bathroom, bedroom, 
kitchen, tub, shower, 一 一 
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T T T 
—0.05 0.00 0.05 
Difference in Topic Proportions (C---A) 


图 2 夫妻 旅行 者 对 豪华 型 酒店 和 经 济 型 酒店 的 
偏好 差异 

QE E RATÀE 

RE 3 可 知 ,， 相 比 经 济 型 酒店 ,家庭 旅行 者 在 选择 豪华 型 
酒店 时 更 多 关注 酒店 的 景色 (Topic8); 而 相 比 豪华 型 酒店 ,家庭 
旅行 者 选择 经 济 型 酒店 时 , 会 比较 关注 酒店 的 交通 便利 性 
(Topic6), 这 是 因为 家 庭 旅行 者 通常 都 携带 小 孩 或 者 老人 四 即使 
经 济 能 力 欠 佳 , 接受 较 低档 次 的 酒店 , 也 要 注重 交通 的 便利 性 。 


1: bedroom, bathroom, 
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shower 


2: coffe, breakfast, 
carpet, hot, nice, towel 
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M R 
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Difference in Topic Proportions (C---A) 


图 3 家 庭 旅 行者 对 豪华 型 酒店 和 经 济 型 酒店 的 
偏好 差异 
@ 朋 友 旅 行者 
RE 4 可 知 , 相 比 经 济 型 酒店 ， 朋 友 旅行 者 在 选择 豪华 型 酒 
店 时 更 多 关注 酒店 的 氛围 (Topic6); 而 相 比 豪华 型 酒店 ,朋友 旅 
行者 选择 经 济 型 酒店 时 , 会 比较 关注 酒店 的 卧室 特色 (Topic7)。 
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1: shower, bathroom, bed, ki 
tv, carpet, tub i 
2: suit, cosmo, terrac, 
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Difference in Topic Proportions (C---A) 


图 4 朋友 旅行 者 对 豪华 型 酒店 和 经 济 型 酒店 的 
偏好 差异 
@ 独 自 出 行 的 旅行 者 
RE 5 可 知 ， 相 比 经 济 型 酒店 ,独自 出 行 的 旅行 者 在 选 
择 豪 华 型 酒店 时 更 多 关注 酒店 的 整体 感觉 (Topic1)， 包 括 位 
置 、 员 工 、 卫 生 等 。 
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图 5 独自 出 行 的 旅行 者 对 豪华 型 酒店 和 经 济 型 
酒店 的 偏好 差异 
5 结 语 


5.1 局 限 性 和 未 来 的 研究 方向 

笔者 在 现 有 研究 的 基础 上 , 实现 了 一 定 的 突破 和 
改进 ， 虽 然 存在 一 定 的 局 限 性 , 但 这 也 为 未 来 的 研究 
提供 了 方向 : 

(1) 数据 集 仅 来 源 于 一 个 评论 网 站 (TripAdvisor. 
com) 中 的 一 个 城市 ( 拉 斯 维 加 斯 )， 导 致 实验 结果 可 能 
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不 具有 充分 的 代表 性 , 未 来 可 以 考虑 从 多 个 在 线 评论 
网 站 中 采集 数据 , 并 包含 多 个 城市 的 酒店 评论 数据 ， 
从 地 域 方面 对 酒店 在 线 评论 进行 文本 分 析 。 

(2) 笔者 在 STM 模型 中 仅 加 入 “酒店 档次 ”作为 
协 变量 , 仅 考虑 了 旅行 者 对 不 同 档次 酒店 的 偏好 差异 ， 
忽视 了 其 他 可 能 影响 酒店 服务 偏好 的 因素 (如 评论 者 
的 性 别 、 年 龄 等 )。 示 来 研究 中 ,可 以 考虑 加 入 更 多 协 
变量 , 探测 不 同 旅 行者 对 酒店 服务 的 偏好 差异 。 
52 ”管理 启示 

酒店 档次 对 酒店 评论 评分 有 影响 , 豪华 型 酒店 的 
总 体 平均 评分 高 于 经 济 型 酒店 的 总 体 平均 评分 ,豪华 型 
酒店 的 设施 齐全 ,提供 的 硬件 设施 服务 也 十 分 完善 。 
而 对 于 豪华 型 酒店 , 若 想 提 高 酒店 的 总 体 评分 , 应 加 强 
员工 的 服务 意识 , 满足 顾客 的 心理 需要 。 而 经 济 型 酒店 
为 了 保持 较 低 的 经 营 成 本 , 无 法 提供 更 多 的 酒店 设施 ， 
但 其 亦 可 以 在 服务 态度 上 进行 改善 ,提升 酒店 的 员工 
服务 质量 ,尤其 是 前 台 的 入 住 手续 办 理 服务 和 退 房 手 
续 办 理 服务 , 顾客 对 酒店 的 第 一 印象 和 最 后 印象 都 会 
对 评分 产生 重要 影响 。 此 外 , 经 济 型 酒店 还 应 格外 加 强 
对 酒店 的 卫生 管理 ,降低 获得 低 分 评论 的 概率 。 

不 同 旅行 类 型 下 的 旅行 者 对 不 同 档次 酒店 的 偏差 
异 也 不 同 。 商 务 旅行 者 评分 较 低 且 最 为 严格 ,夫妻 旅 
行者 评分 较 高 且 最 为 仁慈 。 对 于 豪华 型 酒店 , 酒店 管 
理 者 可 根据 入 住 者 的 旅行 类 型 , 适当 改变 酒店 服务 供 
应 策略 ， 如 为 商务 旅行 者 安排 网 络 信 号 更 好 的 房间 ， 
满足 其 商务 办 公 需 求 ; 为 夫妻 旅行 者 安排 视野 更 开阔 
的 房间 , 满足 其 欣赏 风景 的 需求 。 同 理 , 对 于 经 济 型 酒 
店 , 管理 者 也 可 根据 旅行 者 类 型 ,为 商务 旅行 者 提供 
网 络 更 好 的 房间 , 为 家 庭 旅行 者 提供 更 多 的 食物 选 
择 。 同 时 , 可 以 考虑 为 顾客 提供 免费 的 或 低 收费 的 接 
机 服务 , 降低 顾客 寻找 酒店 地 理 位 置 的 成 本 。 
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Abstract: [Objective] This paper aims to identify various types of travelers’ preferences for hotel services. [Methods] 
First, we classified the hotels as luxury and budget ones, and then divided the travelers into five categories. Second, we 
analyzed individual traveler's rating behaviors on the hotel review website TripAdvisor. Finally, we analyzed the latent 
topics of hotel reviews with the help of Structure Topic Model (STM) to identify travellers’ preferences for hotel 
services. [Results] We found that the average rating scores of luxury hotels were higher than the budget ones and 
travelers did have different preferences for hotel services. [Limitations] The dataset for our study was not large enough. 
We did not consider the impacts of gender and age to hotel rating and online review contents. [Conclusions] Analyzing 
travelers! preferences for hotels could help both the managers and travelers make right decisions. 
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